آمار و احتمال Probability and Statistics سید صابر ناصرعلوی بخش مهندسی عمران دانشگاه شهید باهنر کرمان
آمار و احتمال
Measures of Central Tendency Sample mean population mean Median, mode
spread or dispersion Measures of Variability sample variance population variance
Sample standard deviations Population standard deviations
coefficient of variation (CV) ضریب تغییرات نشان دهنده مقدار پراکندگی جهت نرمالیزه کردن انحراف معیار )جهت مقایسه دو یا چند نمونه آماری( فرض کنید انحراف معیار 3 مایل در ساعت سرعت میانگین نمونه 60 مایل بر ساعت )ضریب تغییرات= 0/05( انحراف معیار به طور نسبی کوچک است سرعت میانگین نمونه 15 مایل بر ساعت انحراف معیار به طور نسبی بزرگ است )ضریب تغییرات= 0/2(
Descriptive Statistics for Speeds on Indiana Roads
Measures of Association The population and sample covariance
correlation parameter
Unbiasedness Efficiency Consistency Sufficiency Properties of Estimators
Methods of Displaying Data Histograms Ogives =cumulative relative frequency graphs Box Plots Scatter Diagrams Bar and Line Charts
Histogram for bus ages in the State of Indiana (1996 data)
Ogive for bus ages in the State of Indiana
The box plot
scatter plot
U.S. GDP by major social function (1995)
Percent miles of urban interstate by pavement roughness category
Motor vehicle fatal accidents by posted speed limit
Percent of on-time arrivals for December 1997
U.S. revenue passenger enplanements 1954 through 1999
probability theory event = a set or collection of outcomes=subset of the sample space
Discrete Random Variables probability distribution of a discrete random variable = probability mass function cumulative distribution function (cdf)
summary measures of random variable center (or mean) spread (or variance)
مثال جدول زیر فهرستی از سرعتهای مشاهده شده برای عدهای از عابرین پیادهای که از تقاطعی عبور میکردند را در خود دارد. موارد زیر را برای نمونه مشاهده شده از سرعتها معین کنید: 1. سرعت میانگین 2. واریانس 3. انحراف معیار
clear all clc MATLAB Code a=[1.10;1.41;1.05;1.12;1.05;1.19;1.24;1.33;1.16;1.25;1.1 3;1.19;1.13;1.15;1.26;1.56;1.38;1.01;1.19;1.41;]; mean(a) var(a) std(a)
پاسخ از آنجا که احتمال پیش آمدن هر کدام از مشاهدات برابر است P(x) برای همه مقادیر سرعت ثبت شده برابر است با که n )تعداد مشاهدات( برابر 20 است. در این مورد رابطه بین میانگین واریانس و انحراف معیار را میتوان به شکل زیر بیان کرد )محاسبات را میتوان با مایکروسافت اکسل همانطور که در کاربرگ شکل بعد آمده انجام داد(:
)1( برای محاسبه میانگین حاصل جمع دادهها در خانه B24 محاسبه شده است. این حاصل جمع را در خانه B26 به 20 تقسیم کردهایم که مقدار میانیگن 216/1 m/s بدست آمده است. )2( برای محاسبه واریانس و انحراف معیار ستون دیگری ستون C ایجاد شد که در آن مقادیر را قرار دادیم. مقادیر را در خانه C24 با هم جمع کردیم و عدد 3817/0 بدست آمد. وارایانس را در خانه C27 و با تقسیم مقدار خانه C24 به تعداد 20 بدست آوردیم )لطفا حتما به این نکته توجه کنید که از آنجایی که ما واریانس یک نمونه را میگرفتیم نه واریانس جمعیت را مقدار بدست آمده را باید تقسیم بر (1-n) میکردیم نه n ولی بهخاطر تسهیل در محاسبات از n استفاده شد. (. انحراف معیار هم در خانه B28 محاسبه شده است.
انواع توزیع ها: توزیع گسسته توزیع دوجمله ای توزیع هندسی توزیع پوآسون توزیع پیوسته توزیع نرمال
Examples of Discrete Probability Distributions The Binomial Distribution The Geometric Distribution The Poisson Distribution
The Binomial Distribution probability of x successes in n independent trials Microsoft Excel: BINOMDIST(x, n, p, 0) MATLAB: disttool
The Geometric Distribution the probability that the first success will occur on the xth trial MATLAB: disttool the probability that x number of events occur within a stated time interval, t
The Poisson Distribution the probability that x number of events occur within a stated time interval, t Microsoft Excel: POISSON(x,(λt), 0) MATLAB: disttool
مثال یک فرودگاه پذیرای سه نوع هواپیماست: سنگین )H( بزرگ )L( و کوچک )S(. در طول یک ساعت عادی از روز تعداد و نوع هواپیماهایی که فرود میآیند اینگونه است: 30 هواپیمای سنگین 50 هواپیمای بزرگ و 120 هواپیمای کوچک. احتمال برآمدهای فرود زیر را مشخص کنید: 1. هواپیمای بعدی سنگین است. 2. بهطور دقیق از هر 10 هواپیما 3 تای آنها سنگین است. 3. از هر 10 هواپیما حداقل 3 تای آنها سنگین است. 4. اولین هواپیمای سنگین سومین هواپیمایی است که فرود میآید.
پاسخ )1( احتمال اینکه یک هواپیما سنگین باشد را میتوان با تقسیم تعداد هواپیماهای سنگین در یک ساعت بر تعداد کل هواپیماها بدست آورد: =0/ 15 = )هواپیمای سنگین بودن( P )2( احتمال اینکه دقیقا از هر 10 هواپیما 3 تای آنها سنگین باشد را میتوان با استفاده از توزیع دوجملهای بدست آورد. تعداد آزمونها و احتمال پیروزی) p ( 3 )x( برابر است با 10 تعداد پیروزیها )n( 0/15 است. پس با استفاده از اکسل میتوان احتمال خواسته شده را به شکل زیر محاسبه کرد: = 0/13 0( )3 10 0/15 BINOMDIST = 3( هواپیما از 10 هواپیما سنگین باشند( P
MATLAB Solution 1.2 1 0.8 0.6 0.4 0.2 0 0 2 4 6 8 10
)3( احتمال اینکه حداقل 3 تا از هواپیماها سنگین باشند برابر است با: (3.P(X این احتمال میتواند زمانی رخ دهد که تعداد سه یا بیشتری از فرودها هواپیماهای سنگین باشند. بهطور معکوس این احتمال برابر است با (2 P(X 1. P(X.(2 و میتوان آن را اینگونه محاسبه کرد: P(X 2) = BINOMDIST(2, 10, 0.15, 1) = 0.82 P(X 3) = 1 - P(X 2) = 1-0.82 = 0.18 )4( احتمال اینکه اولین هواپیمای سنگین که فرود میآید سومین هواپیمای فرودی باشد را میتوان با استفاده از توزیع هندسی محاسبه کرد. محاسبه احتمال اینکه اولین پیروزی در سومین آزمون رخ خواهد داد میتواند به طریق زیر حساب شود:
MATLAB Solution 1 0.8 0.6 0.4 0.2 0 0 5 10 15 20 25
مثال مسافران با نرخ 450 مسافر در ساعت به مقابل پیشخوان بلیط فرودگاهی میرسند. اگر بتوان الگوی رسیدن را با استفاده از توزیع پوآسون توضیح داد احتمال اینکه 3 2 1 0 یا 4 مسافر در طول یک بازه زمانی 15 ثانیهای به پیشخوان برسند چقدر است
پاسخ نرخ رسیدن )λ( را بر حسب مسافر بر ثانیه معین کنید. از آنجا که نرخ رسیدن 450 مسافر بر ساعت است این مقدار برابر خواهد بود با 0/125= 3600 450 مسافر در ثانیه. در طول یک بازهی 15 ثانیه ای λt برابر خواهد بود با: = 1/875 15 0/125 احتمال رسیدن 0 3 2 1 یا 4 مسافر در طول یک بازه زمانی 15 ثانیهای با استفاده از تابع اکسل = (0,x),1.875 POISSON در شکل اسالید بعد به نمایش درآمده است. احتمال رسیدن چهار مسافر یا بیشتر بهصورت )3 0(P 1 2 1 بهصورت زیر محاسبه میشود: P (X4) = 1. 0 P (X=0) P (X=1) P (X=2) P (X=3) = 1. 0 0. 153. 0. 288 0. 270 0. 168 = 0. 121
MATLAB Solution 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 0 1 2 3 4 5 6 7 8
مثال یک خطعبور از جهتی از یک تقاطع تنها مختص خودروهای چپگرد است و میتواند حداکثر پنج خودرو را در خود جای دهد. حجم ترافیک 900 veh/h و %20 خودروها به چپ میپیچند. زمان الزم برای تمام یک چرخه 60 ثانیه است و زمان چراغ سبز اختصاص یافته برای خطعبور چپگرد حداکثر به پنج خودرو میرسد. احتمال اینکه صفی از خودروهای چپگرد تشکیل شود و خطعبور وسط را هم مسدود کند چقدر است
پاسخ اگر در طول شصت ثانیهی چرخه شش خودرو چپگرد یا بیشتر به تقاطع برسند حداقل یک خودرو پشت آنهای دیگر میماند و خطعبور وسط را مسدود میکند. چنین فرض شده است که توزیع پوآسون قابل انجام است. که نرخ رسیدن برای خودورهای چپگرد بر حسب veh/sاست را محاسبه میکنیم: خودرو چپگرد در ثانیه 0.05=3600/(900*0.2)=λ از آنجا که طول چرخه 60 ثانیه است و در هر ثانیه 0/05 خودروی چپگرد به تقاطع میرسد تعداد خودروهای چپگرد به ازای هر چرخه برابر است با: = 3 60 0.05 = λt
احتمال رسیدن شش خودرو یا بیشتر برابر است با 1 منهای احتمال رسیدن پنج خودرویا کمتر. پس P[X 6] = 1.0 - P[X 5] [5 P[X را میتوان با تابع (1 POISSON(5,,3 در اکسل محاسبه کرد تا مقدار تابع تجمعی که با = 5 X و = 3 λt متناظر است بدست آید. )نکته: از آنجا که محاسبات برای cdf است در تابع اکسل 1 جایگزین صفر میشود. ) استفاده از تابع اکسل میدهد P[X 5] = 0.916 and P[X 6] = 1.0-0.916 = 0.084 به بیان دیگر انتظار میرود در %8/4 دورهها صف ایجاد شود.
0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 0 2 4 6 8 10 12
Continuous Distributions
Normal Distributions f(x) = NORMDIST(x, m, s,0) g(the p-fractile of X) NORMINV(p, m, s)
لاثم یاضاقت هنازور کی پمپ نیزنب یعیزوت لامرن.دراد نیگنایم نآ 8000 رتیل رد زور و فارحنا رایعم نآ 1600 رتیل رد زور.تسا 10000 هنازور رتیل نیزنب هب هاگیاج نیا قلعت.دریگیم صخشم :دینک.1 لامتحا p یارب هکنیا یدادعت زا نایرتشم لیلدهب دوبمک نیزنب یلاخ تسد دندرگ زاب.2 دادعت یاهرتیل دوجوم رد نزخم هکیروطهب یاضاقت هنازور اهنت کی رد زور زور تسیب زا نیگنایم اضاقت رتشیب.دشاب
پاسخ بخش )1( احتمال اینکه تعدادی از مشتریان بنزین نزده برگردند برابر است با احتمال اینکه تقاضا از موجودی روزانه 1000 لیتر بیشتر باشد. میتوان با استفاده از اکسل آن را اینگونه محاسبه کرد: P(X 10000) = 1.0 - P(X 10000) = 1.0 - NORMDIST(10000, 8000,1600, 1) = 1.0-0.894 = 0.106
بخش )2( برای افزایش تقاضا از عرضهی هر بیست روز یکبار برابر است با احتمال 1/2=0/05. اگر احتمال (g P(X برابر با 0/05 باشد پس احتمال (g P(X برابر 0/95 است. میتوان 0/95 جزء X یعنی g را از اکسل به روش زیر محاسبه کرد: g = NORMINV(0.95, 8000, 1600) = 10632 liters به عبارت دیگر این جایگاه به 632 لیتر بنزین اضافی در هر روز نیاز دارد.